Иерархия промптов: от инструкций к логике
Промптинг эволюционировал от простых командных вводов к сложным архитектурами рассуждений которые направляют внутренний процесс обработки модели.
Основные понятия
- Нулевая подсказка (Zero-shot Prompting): Предоставление описания задачи без каких-либо примеров (например, «Переведите это на французский»).
- Малошаговая подсказка (Few-shot Prompting): Использование «демонстраций» (пар вход-выход) для определения пространства меток и желаемого формата.
- Цепочка рассуждений (Chain-of-Thought, CoT): Метод промптов, который побуждает модель генерировать промежуточные шаги рассуждений.
- Эмерджентные свойства: Сложное рассуждение не программируется напрямую, а «возникает» в моделях, обычно превышающих 10 млрд параметров.
Сдвиг в рассуждениях
- Следование инструкциям: Прямое сопоставление входа с выходом.
- Обучение в контексте: Изучение паттернов на основе предоставленных примеров (малошаговое обучение).
- Логическая декомпозиция: Разбиение проблем на последовательные шаги (цепочка рассуждений).
- Контроль процесса: Приоритет точности «мыслительных» шагов перед конечным ответом (как видно в OpenAI o1).
Ключевая идея
Производительность модели в условиях малошагового обучения сильно зависит от распределения меток и релевантности демонстраций, а не только от количества примеров.
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>
Question 1
Which method relies on providing "demonstrations" to guide the model?
Question 2
True or False: Chain-of-Thought reasoning is a capability found in almost all AI models regardless of size.
Challenge: Optimizing Logic Puzzles
Scenario: Optimize a prompt for a model that is struggling with a logic puzzle.
You are using an LLM to solve the following puzzle: "A bat and a ball cost $1.10 in total. The bat costs $1.00 more than the ball. How much does the ball cost?"
Currently, you are passing the prompt exactly as written above, and the model incorrectly answers "$0.10".
Currently, you are passing the prompt exactly as written above, and the model incorrectly answers "$0.10".
Task 1
Identify if the current prompt is Zero-shot or Few-shot.
Solution:
The current prompt is Zero-shot because it provides the task description without any prior examples or demonstrations of similar solved puzzles.
The current prompt is Zero-shot because it provides the task description without any prior examples or demonstrations of similar solved puzzles.
Task 2
Inject the Zero-shot CoT trigger phrase to improve reasoning accuracy. Rewrite the prompt.
Solution:
"A bat and a ball cost $1.10 in total. The bat costs $1.00 more than the ball. How much does the ball cost? Let's think step by step:"
"A bat and a ball cost $1.10 in total. The bat costs $1.00 more than the ball. How much does the ball cost? Let's think step by step:"